2025.11.04 | 超稀疏MoE激活万亿参数；视觉模型看图胜GNN

Update: 2025-11-04

Description

本期的 15 篇论文如下：

[00:23 ] 🧠 Every Activation Boosted: Scaling General Reasoner to 1 Trillion Open Language Foundation（全激活赋能：将通用推理模型扩展到万亿参数的开放语言基座）

[01:03 ] 👁 The Underappreciated Power of Vision Models for Graph Structural Understanding（被低估的视觉模型在图结构理解中的强大潜能）

[01:38 ] 💡 UniLumos: Fast and Unified Image and Video Relighting with Physics-Plausible Feedback（UniLumos：基于物理可信反馈的统一图像与视频快速重打光框架）

[02:37 ] 🕸 Generalizing Test-time Compute-optimal Scaling as an Optimizable Graph（将测试时计算最优扩展泛化为可优化的图）

[03:11 ] 🤖 PHUMA: Physically-Grounded Humanoid Locomotion Dataset（PHUMA：基于物理的人形机器人运动数据集）

[03:48 ] 🔭 ToolScope: An Agentic Framework for Vision-Guided and Long-Horizon Tool Use（ToolScope：面向视觉引导与长程工具使用的智能体框架）

[04:30 ] 🧠 UniREditBench: A Unified Reasoning-based Image Editing Benchmark（UniREditBench：基于统一推理的图像编辑评测基准）

[05:23 ] 🔄 ROVER: Benchmarking Reciprocal Cross-Modal Reasoning for Omnimodal Generation（ROVER：统一多模态生成中的双向跨模态推理基准测试）

[06:04 ] 🌍 Towards Universal Video Retrieval: Generalizing Video Embedding via Synthesized Multimodal Pyramid Curriculum（迈向通用视频检索：通过合成多模态金字塔课程泛化视频嵌入）

[06:44 ] 🌍 World Simulation with Video Foundation Models for Physical AI（基于视频基础模型的物理AI世界仿真）

[07:20 ] 🧠 TIR-Bench: A Comprehensive Benchmark for Agentic Thinking-with-Images Reasoning（TIR-Bench：面向“图像思维”智能体推理的综合评测基准）

[08:03 ] 🧭 NaviTrace: Evaluating Embodied Navigation of Vision-Language Models（NaviTrace：评测视觉-语言模型具身导航能力）

[08:45 ] 📏 Do Vision-Language Models Measure Up? Benchmarking Visual Measurement Reading with MeasureBench（视觉语言模型能否胜任？基于MeasureBench的视觉测量读数基准测试）

[09:23 ] 🧭 Actial: Activate Spatial Reasoning Ability of Multimodal Large Language Models（激活多模态大语言模型的空间推理能力）

[10:07 ] 🐱 LongCat-Flash-Omni Technical Report（LongCat-Flash-Omni技术报告：5600亿参数开源全模态实时音视频交互模型）

</figure>

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

Comments

In Channel

2025.11.05 | 向量草图测代码；先画后想补视觉

2025-11-0511:31

2025.11.04 | 超稀疏MoE激活万亿参数；视觉模型看图胜GNN

2025-11-0411:06

2025.11.03 | OS-Sentinel实时守护手机操作安全；ThinkMorph让小模型边想边画

2025-11-0311:02

【月末特辑】10月最火AI论文 | 幼龙BDH稀疏可解释；迷你递归7兆碾压大模型

2025-11-0222:46

【周末特辑】11月第1周最火AI论文 | 循环模型省参强推理；Concerto 2D-3D自监督涨点

2025-11-0111:53

2025.10.31 | Emu3.5统一预测时空；扩散提示驱动机器人

2025-10-3110:09

2025.10.30 | 看图写码7B逆袭；视频思维RL破局

2025-10-3011:29

2025.10.29 | 通义深度研究报告；小模型折记忆胜671B巨模型

2025-10-2908:14

2025.10.28 | Point Transformer无标对齐长空间；代码递归统一粗细粒度

2025-10-2811:05

2025.10.27 | DeepAgent一步推理+ToolPO；视频即提示DiT秒控百种语义

2025-10-2710:29

【周末特辑】10月第4周最火AI论文 | 内部概率+投票剪尾，RPC省样本提精度

2025-10-2613:26

2025.10.24 | AdaSPEC挑40% token提速两成；AutoPage 10美分生成交互网页

2025-10-2410:39

2025.10.23 | 线性注意力显存降十倍；动态裁剪PPO稳提分

2025-10-2310:46

2025.10.22 | LightMem压缩记忆千倍提速12倍；闭环世界模型微调8万数据反超巨兽

2025-10-2211:14

2025.10.21 | 模型不懂光影折射；小模型也能写报告

2025-10-2110:06

2025.10.20 | RPC剪枝提速保准；OmniVinci小数据跨模态称王

2025-10-2011:11

【周末特辑】10月第3周最火AI论文 | 量化噪声变探索，单卡跑RL；冻结编码器放语义，DiT生成新纪录

2025-10-1813:30

2025.10.17 | AI眼镜预判式服务；视频生成补想象力

2025-10-1708:40

2025.10.16 | UniMoE一统语音音乐；注意力图点亮大模型推理

2025-10-1610:13

2025.10.15 | 像素级自监督ViT刷新生成基准；多智能体评测网文翻译新标尺

2025-10-1510:38

00:00

1.0x

2025.11.04 | 超稀疏MoE激活万亿参数；视觉模型看图胜GNN

#box-pro-ellipsis-176240694720815{-webkit-line-clamp:2;}2025.11.04 | 超稀疏MoE激活万亿参数；视觉模型看图胜GNN

2025.11.04 | 超稀疏MoE激活万亿参数；视觉模型看图胜GNN

2025.11.04 | 超稀疏MoE激活万亿参数；视觉模型看图胜GNN